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摘 要 根据 任务 需要 准确 提取 工作 记忆 表征 对 提高 认 知 效率 具有 重要 意义 。 但 工作 记忆 提 
取 准 确 性 的 调节 因素 及 机 制 尚 不 清楚 。 本 研究 以 关系 人 类 生存 和 发 展 的 价值 因素 为 切入 点 ， 
在 工作 记忆 提取 阶段 呈现 奖赏 线索 ， 分 别 采用 单 次 提取 (实验 1) 与 连续 提取 任务 (实验 2) 考 察 
工作 记忆 提取 过 程 的 奖赏 调节 机 制 。 考 察 工作 记忆 提取 过 程 的 奖赏 调节 机 制 。 实 验 1 和 2 分 
别 采用 单 次 提取 和 连续 提取 任务 。 本 研究 发 现 ，(1) 奖 赏 可 以 直接 促进 工作 记忆 提取 准确 性 ; 
(2) 奖 党 促进 作用 的 机 制 是 对 工作 记忆 资源 的 再 分 配 ，(3) 奖 赏 促进 作用 受 提 取 顺 序 和 个 体 工作 
记忆 能 力 差 异 的 影响 。 这 些 发 现 揭示 了 工作 记忆 提取 阶段 的 奖赏 调节 机 制 ， 为 促进 认 知 效率 


提供 了 科学 依据 。 
关键 词 工作 记忆 ， 奖 赏 ， 提 取 准确 性 
1 引言 


工作 记忆 是 人 类 实现 目标 导向 行为 的 关键 ， 影 响 着 人 类 的 生存 和 发 展 。 在 工作 记忆 过 程 
中 ， 个 体 不 仅 要 储存 和 加 工 周 围 的 环境 信息 ， 还 要 提取 相关 表征 与 之 进行 交互 (Baddeley， 


1992, 2000; Baddeley & Hitch, 1974; Cowan, 2017; Eriksson et al., 2015) 。 个 体能 和 否 根据 任务 需 
要 准确 提取 工作 记忆 表征 是 有 效 推 进 目标 导向 活动 的 关键 。 因 此 ， 揭 示 工 作 记忆 提取 准确 性 
的 调节 机 制 ， 对 促进 认 知 活动 效率 和 社会 适应 具有 重要 意义 。 但 以 往 关注 这 一 科学 问题 的 研 
究 还 相对 较 少 。 

奖赏 关系 着 价值 计算 ， 显 著 地 影响 着 人 类 的 认 知 和 行为 。 如 ， 奖 赏 可 以 促进 工作 记忆 加 


工 (Atkinson et al., 2018; Beck et al., 2010; Bowen et al., 2020; Gong & Li, 2014; Gong et al., 2016; 


| 由 


Hitch et al., 2018, 2020; Kiss et al., 2009; Klyszejko et al., 2014; Lin & Fougnie, 2022; Valentin & 


O’Doherty, 2009)。 这 种 促进 作用 既 可 以 基于 对 工作 记忆 表征 的 增强 (Gong & Li, 2014; Klink et 


al.,2017)， 也 可 以 基于 对 工作 记忆 资源 的 再 分 配 (Hitch et al., 2018; Hu et al., 2014). 。 如 Gong 和 
Li(2014) 发 现 高 奖赏 关联 项 目 虽 未 获得 更 多 的 空间 注意 ， 但 其 表征 却 保持 的 更 好 。Hnu 等 人 
(2014) 在 序列 记忆 任务 中 发 现 : 对 序列 中 首位 (或 末 位 ) 项 目 赋 予 高 分 值 时 ， 其 记忆 成 绩 的 提高 


会 伴随 近 因 (或 首 因 ) 效 应 的 减弱 。 这 表明 奖赏 可 以 引导 总 量 不 变 的 、 有 限 的 资源 在 不 同 项 目 
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项 目 成 绩 更 好 (Rerko et al., 2014)。 即 选择 性 地 提取 工作 记忆 中 的 某 一 个 客体 表征 ， 会 导致 随 
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联结 学 习 建 立 不 同 颜色 与 价值 
好 ， 则 表明 奖赏 可 以 在 不 


使 用 G*power 软件 (Faul et al., 2007, 2009) 估 算 所 需 样本 量 ， 设 置 a = 0.05，1-B= 0.95。 参 
奖赏 效应 的 效应 量 (n; 
募 24 名 在 校 大 学 生 ( 其 中 ! 


上 最 小 样本 量 


性 7 名 ， 女 性 17 名 ) 自 愿 参与 本 实验 ， 年 龄 在 


学 院 伦理 委员 会 审查 。 


分 别 呈现 在 以 


距离 屏幕 57 厘米 处 。 实 验 程 序 采 用 


分 辨 率 


央 注 视 


点 为 中 心 的 、 半 径 为 5° 的 虚拟 圆 的 12 点 、4 点 和 8 点 钟 位 置 上 。 同 屏 呈 现 的 三 个 圆 形 颜色 相 


同 ， 可 以 为 红色 (RGB: 255, 0, 0)、 蓝 色 (RGB: 0, 0, 255) 或 绿 


色 (RGB: 0, 255, 0)。 


工作 记忆 测试 包括 编码 、 延 迟 和 提取 三 个 阶段 。 编 码 阶 段 ， 记 忆 刺 激 为 三 个 有 方向 的 圆 
形 光 栅 ( 视 角 $"x5" 左 右 ， 对 比 度 0.3)。 同 屏 呈 现 的 三 个 光栅 方向 不 同 ， 且 角度 差 不 小 于 15 "。 
记忆 刺激 位 置 与 联结 学 习 阶 段 刺 激 位 置 相同 。 提 取 阶 段 ， 探 测 刺激 为 一 个 方向 随机 的 圆 形 光 
WALH 5"x5"， 对 比 度 0.5)， 其 位 置 与 某 个 记忆 项 目 相 同 。 此 外 ， 从 编码 阶段 开始 ， 屏 幕 中 
始终 还 存在 三 个 中 空 的 圆 环 (视角 5°x5")， 直 到 被 试 反 应 结束 后 消失 。 圆 环 的 位 置 分 别 与 三 
记忆 项 目 对 应 ， 且 圆 环 边缘 与 记忆 项 目 边 缘 重 个 。 编 码 和 延迟 阶段 ， 三 个 圆 环 始终 为 灰色 


(RGB: 128, 128, 128)。 提 取 阶 段 ， 三 个 圆 环 同时 变 为 红色 、 蓝 色 或 绿色 ， 以 提供 奖赏 线索 。 
A 
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图 1 实验 1(A) 联 结 学 习 和 (B) 工 作 记 1 


乙 测试 阶段 流程 


2.1.3 实验 设计 与 过 程 
(1) 联 结 学 习 阶 段 

联结 学 习 阶段 为 单 因 素 3 水 平 (奖赏 ， 高 、 低 、 无 ) 被 试 内 设计 。 流 程 如 图 1A 所 示 。 首 先 
呈现 一 个 含 注 视点 的 空 屏 1250~2000ms， 随 后 呈现 三 个 颜色 相同 的 噪点 圆 形 。 噪 点 颜色 为 红 
色 、 绿 色 或 蓝 色 ， 分 别 对 应 无 奖赏 (+0 分 )、 低 奖赏 (+5 分 ) 和 高 奖赏 (+50 分 )。 颜 色 与 奖赏 联结 
的 概率 为 100% 。 颜 色 与 奖赏 水 平 的 对 应 关系 在 被 试 间 平 衡 。 要 求 被 试 判断 刺激 的 颜色 ， 并 
按键 反应 ， 红 色 按 “~” 键 ,绿色 按 “1” 键 ， 蓝 色 按 “一 ” 键 。 按 键 与 颜色 的 匹配 关系 在 
被 试 间 平 衡 。 被 试 按键 后 ， 根 据 反 应 情况 给 予 反馈 ， 持 续 1300ms。 反 馈 内 容 包括 反应 结果 和 
奖励 信息 。 反 应 结果 分 为 “正确 ”“ 错 误 ” 和 “ 太 慢 ”三 种 。 如 果 被 试 在 500ms 内 做 出 正确 
有 反应， 提示“ 正确 ”做 出 错误 反应 ， 提 示 “ 错 误 ” 如 果 被 试 反应 时 间 超 过 500ms， 无 论 按 
键 是 否 正 确 ， 痢 提示 “ 太 慢 ”。 奖 励 信 息 包 括 (1) 当 前 试 次 实际 得 分 、(2) 实 际 总 分 和 (3) 可 获得 


Hk 


总 分 。 H 


中 ， 实 际 总 分 为 截 ] 


全 部 反应 正确 可 以 得 到 的 分 数 之 和 。 仅 当 被 试 反应 正确 
并 在 文字 周围 呈现 与 其 得 分 相同 的 点 数 ， 反 应 错误 或 超时 都 提示 0 分 ， 


时 


上 到 当前 试 次 被 试 实际 得 到 的 分 数 之 和 ;， 可 获得 总 分 为 如 果 被 试 


， 按 刺激 颜色 给 予 对 应 的 奖励 分 数 ， 
且 文 字 周 围 无 其 他 刺 


激 。 实 验 开始 前 先进 行 10 次 练习 ， 随 后 进行 正式 实验 ， 共 120 个 试 次 。 


(2) 工 作 记 忆 测 试 阶段 
测试 阶段 为 单 因素 3 KFH: 


高 、 低 、 无 ) 被 试 内 设计 。 流 程 如 图 


带 注视 点 的 空 屏 500ms。 然 后 再 呈现 三 个 朝向 各 不 相同 的 


记忆 光栅 的 方向 。 每 个 光栅 外 均 包 


BE 


Bie =: 


到 试 次 结束 。 延 迟 期 间 ， 


名 随机 的 圆 形 》 


E 栅 ， 要 求 被 试 利用 鼠标 调 
按键 盘 空 格 键 和 


个 灰色 


调整 完毕 后 松 开 鼠标 


的 同时 ， 圆 环 | 


灰色 变 为 红色 、 绿 色 或 蓝 色 (三 个 


1B 所 示 。 首先 呈现 


圆 形 光 栅 ， 持 续 1500ms， 要 求 被 试 


圆 环 颜色 不 变 ， 延 迟 2000ms 后 呈现 探测 项 目 


圆 环 ， 光 栅 消 失 后 ， 圆 环 始终 保留 在 屏幕 上 直 
。 探 测 项 目 为 一 个 方 


节 光 栅 方 向 ， 使 之 与 对 应 位 置 记忆 项 目 


有 认 。 三 个 记忆 项 目 


方向 一 致 ， 
被 探测 的 概率 相同 。 探 测 项 目 出 现 


圆 环 颜色 相同 )， 以 提示 当前 试 次 正确 反应 


可 以 获得 的 奖励 。 颜 色 与 价值 的 对 应 关系 与 联结 学 习 阶 段 一 致 。 被 试 按键 后 ， 根 据 反应 情况 
给 予 反 馈 ， 持 续 750ms。 反 馈 内 容 同 样 包括 反应 结果 和 奖励 信息 。 一 方面 ， 反 应 结果 分 为 
“正确 ”和 “错误 ”两 种 。 如 果 被 试 报告 的 角度 与 目标 项 目 角 度 之 差 小 于 13"， 则 提示 “ 正 
确 ” 反之 ， 提示 “错误 ”。 男 一 方面 ， 与 正确 和 错误 反应 伴随 的 奖励 信息 ， 与 联结 学 习 阶 段 


相同 。 实 验 开始 前 先进 行 10 次 练习 。 随 后 进行 正式 实验 ， 


实验 1 共 需 30 分 钟 左 右 。 联 结 学 习 和 记忆 测试 


试 休息 


2.2 结果 


= 


£120 个 试 次 。 


， 正 式 实验 每 完成 40 个 试 次 ， 提 示 被 


数据 采用 R 3.6.2 和 JASP 0.16.4 软件 进行 统计 分 析 与 处 理 。 剔 除 正 负 3 个 标准 差 以 外 的 
数据 后 进行 分 析 ( 实 验 1 各 阶段 数据 剔除 量 <1%; 实验 2 各 阶段 数据 剔除 量 <2%)。 联 结 学 习 阶 


段 以 正确 
验 是 否 建立 颜色 与 价值 的 联结 。 


率 和 反应 时 为 指标 ， 通 过 单 因 
测试 阶段 以 被 试 反应 的 角度 偏差 作为 估计 记忆 准确 性 的 因 变 
量 指标 。 通 过 比较 各 奖赏 条 件 下 的 差异 ， 考 察 奖 赏 对 工作 记忆 准确 性 的 影响 。 


素 重复 测量 方差 分 析 比 较 各 奖赏 条 件 下 的 差异 ， 以 检 


算 方法 为 : 将 被 试 报告 的 


A5 H 


标 项 目 人 


平 的 多 重 比较 均 采用 


2.2.1 联结 学 习 阶 段 


角度 偏差 的 计 


度 做 差 后 取 绝 对 值 。 此 外 ， 所 有 涉及 三 个 变量 水 


Bonferroni 矫正 (Dunn, 1961)。 


分 别 以 正确 率 和 反应 时 为 


因 变 量 ， 


进行 单 因 


RIZK] 


FCR: 高 、 低 、 无 ) 重 复 测量 方差 


分 析 。 正 确 率 上 ， 奖 赏 效应 显著 (F(2, 46) = 4.14, p = 0.022, n? = 0.15, BFio= 3.604)。 两 两 比较 


发 现 ， 高 奖赏 QM = 0.92) 和 无 奖赏 (M = 0.80) 条 件 之 间 正 确 率 差异 边缘 显著 (!23) = 2.45, p = 
0.066, Cohen’s d= 0.57)。 高 奖赏 和 低 奖 赏 (M = 0.90)、 以 及 低 奖 赏 和 无 奖赏 条 件 之 间 正 确 率 差 


异 不 显著 (ps > 0.24) 。 反 应 时 上 ， 奖 赏 效 应 显著 (F(2, 46) = 13.21, p < 0.001, n? = 0.37, BFio= 


853.416)。 高 奖赏 条 件 反 应 时 (M = 421.58) 显 著 快 于 低 奖 赏 (M = 447.00) 和 无 奖赏 (WM = 462.96) 


条 件 (((23) = -2.92 & -4.85, p = 0.023 & p < 0.001, Cohen’s d = 0.64 & 1.04)。 低 奖赏 和 无 奖赏 条 


件 之 间 反 应 时 差异 不 显著 (1(23) = 2.28, p = 0.098, Cohen’s d = 0.40)( 图 2A)。 该 结果 表明 被 试 已 
成 功 建立 颜色 和 奖赏 之 间 的 联系 。 
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图 2 (A) 实 验 1 和 (B) 实 验 2 联结 学 习 阶 段 反 应 时 结果 


注 :“e” 代 表 均 值 。*m < 0.05, ***p < 0.001 


2.2.2 工作 记忆 测试 阶段 
对 角度 偏差 进行 单 因 素 3 水 平 ( 奖 赏 : 高 、 低 、 中 ) 重 复 测 量 方差 分 析 。 结 果 发 现 奖赏 主 


H 


效应 显著 (F(1, 23) = 6.52, p = 0.003, n? = 0.22, BFio= 13.297) ( 见 图 3)。 无 奖赏 条 件 的 角度 偏差 


(M = 21.20) 显 著 大 于 高 奖赏 (MY = 16.74) 和 低 奖赏 (M = 17.65) 条 件 (!(23) = 3.42 & 2.72, p = 0.004 
& 0.027, Cohen’s d = 0.74 & 0.59)。 但 低 奖 赏 和 高 奖赏 条 件 之 间 角 度 偏差 的 差异 不 显著 (1 < 1) 0 
该 结果 表明 提取 阶段 呈现 的 奖赏 信号 可 以 提高 工作 记忆 提取 准确 性 。 但 奖赏 的 调节 作用 主要 
体现 在 有 奖赏 和 无 奖赏 条 件 之 间 。 高 奖赏 和 低 奖 赏 调节 作用 的 差异 需 进一步 检验 。 同 时 ， 奖 
赏 的 调节 机 制 也 有 待考 察 。 


局 低 I 
奖 党 员 


到 3 实验 1 工作 记忆 测试 阶段 角度 偏差 结果 
注 :“e ”代表 均 值 。*p < 0.05, **p < 0.01 


3 实验 2 奖赏 调节 工作 记忆 提取 准确 性 的 机 制 

实验 1 发 现 奖赏 可 以 促进 工作 记忆 提取 准确 性 。 有 奖赏 条 件 的 记忆 成 绩 均 好 于 无 奖赏 条 
件 。 而 高 、 低 奖赏 条 件 之 间 虽 有 差异 却 未 达到 显著 水 平 。 因 此 ， 实 验 2 进一步 检验 两 者 的 差 
异 。 同 时 采用 连续 提取 任务 ， 以 及 前 、 后 测 实验 设计 ， 考 察 奖赏 促进 工作 记忆 提取 准确 性 的 
机 制 。 实 验 2 包括 前 测 、 联 结 学 习 、 后 测 和 信心 判断 四 个 阶段 。 前 测 阶段 无 奖赏 信号 ， 通 过 
考察 提取 顺序 的 影响 ， 检 验 先 、 后 提取 项 目 记 忆 成 绩 的 基线 水 平 。 后 测 阶段 有 奖赏 信号 ， 通 
过 考察 提取 顺序 和 高 奖赏 线索 位 置 的 影响 ， 检 验 奖 赏 对 先 、 后 提取 项 目 记忆 表征 的 影响 及 机 
制 。 若 奖赏 可 以 调节 连续 提取 过 程 ， 则 高 奖赏 对 后 提取 项 目 记 忆 成 绩 的 改善 可 能 强 于 对 先 提 
取 项 目 成 绩 的 促进 。 调 节 机 制 方面 ， 若 奖赏 可 以 增强 记忆 表征 ， 则 高 奖赏 项 目 后 提取 更 有 利 
于 提高 平均 记忆 成 绩 。 反 之 若 奖赏 的 调节 机 制 是 资源 再 分 配 ， 则 高 奖赏 项 目的 提取 顺序 不 影 
响 平 均 记忆 成 绩 。 此 外 ， 根 据 前 人 研究 ， 奖 赏 的 调节 作用 可 能 受到 个 体能 力 的 影响 (Griffin et 
al., 2019)， 因 此 以 未 受奖 党 影响 的 前 测 成 绩 为 标准 区 分 被 试 工作 记忆 能 力 水 平 ， 考 察 奖 党 调 
节 机 制 的 个 体 差 异 。 信 心 判 断 阶段 要 求 被 试 评价 自己 有 多 大 把 握 可 以 根据 第 一 个 线索 的 颜色 


推测 第 二 个 线索 颜色 ， 以 检验 连续 提取 过 程 中 被 试 是 否 对 线索 顺序 有 预期 。 
3.1 方法 
3.1.1 被 试 


使 用 G*power 软件 估算 所 需 样 本 量 ， 设 置 a = 0.05，1-B = 0.95。 与 实验 IMA, BS 
Grogan 等 人 (2022) 研 究 中 奖赏 效应 的 效应 量 (W? = 0.21)， 设 置 f= 0.52， 估 计 出 最 小 样本 量 为 
12。 为 考察 个 体 差 异 ， 招 募 60 名 在 校 大 学 生 ( 其 中 男性 18 名 ， 女 性 和 2 名) 自愿 参与 本 实验 ， 


年 龄 在 18~26 岁 之 间 (M = 22.70, SD = 2.10)。 分 别 将 前 测 成 绩 前 30% 和 后 30% 的 被 试 作为 高 


能 力 和 低能 力 组， 每 组 被 试 18 人 。 实 验 2 通过 了 东北 师范 大 学 心理 学 院 伦理 委员 会 审查 ， 被 
试 对 实验 目的 未 知 ， 实 验 报 酬 根据 成 绩 表 现 按 比 例 报销 。 
3.1.2 设备 和 实验 刺激 

除 以 下 方面 外 ， 实 验 2 设备 和 刺激 和 实验 1 相同 。 首 先 ， 联 结 学 习 阶 段 的 刺激 由 三 个 颜 
色相 同 的 圆 形 噪 点 刺激 变 为 两 个 ， 分 别 呈 现在 以 中 央 注 视点 为 圆心 、 半 径 5° 的 虚拟 圆 形 的 3 
点 和 9 点 钟 方向 上 ， 刺 激 颜色 为 蓝 色 或 绿色 。 其 次 ， 工 作 记 忆 测 试 包括 前 测 和 后 测 ， 两 者 所 
使 用 的 刺激 相同 。 具 体 而 言 ， 记 忆 刺 激 由 三 个 方向 不 同 的 圆 形 光栅 变 为 两 个 ， 其 呈现 位 置 与 
联结 学 习 阶段 刺激 相同 。 探 测 刺激 是 两 个 依次 出 现 的、 方向 随机 的 圆 形 光栅 。 同 一 试 次 内 ， 
两 个 探测 刺激 出 现 位 置 不 同 ， 分 别 位 于 屏幕 左右 两 侧 ， 与 记忆 刺激 位 置 对 应 ; 不同 试 次 间 ， 
两 个 探测 刺激 出 现 的 位 置 顺序 平衡 。 线 索 刺 激 是 包 庄 在 探测 刺激 外 周 的 蓝 色 或 绿色 圆 环 。 前 
后 两 个 线索 的 颜色 在 试 次 间 平 衡 。 
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前 测 阶段 7500ms (55/110) 一 一 (实际 总 分 /可 获得 总 分 ) 


后 测 阶段 


14 实验 2 前 测 、 后 测 阶 段 流 程 


3.1.3 实验 设计 与 过 程 
(1) 前 测 阶 段 

前 测 阶段 线索 颜色 与 奖赏 无 关 。 将 线索 按 颜色 分 为 中 性 线索 1 和 2， 分 别 与 联结 学 习 和 
后 测 阶段 的 高 、 低 奖赏 颜色 对 应 (如 图 4 中 蓝 色 既 是 中 性 线索 1 颜色 ， 也 是 高 奖赏 颜色 )。 根 
据 探测 顺序 将 探测 项 目 分 为 第 一 个 (TD 和 第 二 个 (T2)。 中 性 线索 1 如 果 与 T1 同时 出 现 则 其 位 
置 为 SP1(Serial Position 1)， 如 果 与 T2 同时 出 现 则 其 位 置 为 SP2 (Serial Position 2)。 因 此 ， 前 
测 阶段 为 2 (中 性 线索 1 位置 ，SP1、SP2)x2( 探 测 项 目 :，T1、T2) 被 试 内 实验 设计 。 

除 以 下 方面 外 ， 实 验 2 前 测 流程 与 实验 1 工作 记忆 测试 阶段 相同 ( 见 图 4)。 首 先 呈 现 注视 
点 500ms， 然 后 呈现 2 个 的 圆 形 光栅 ， 要 求 被 试 记忆 光栅 的 方向 。 光 栅 消 失 后 延迟 2000ms, 


随后 连续 进行 两 次 记忆 探测 ， 每 次 探测 一 个 记忆 项 目 。 


每 个 探测 项 目 出 现时 ， 都 会 伴随 一 


奖赏 线索 。 线 索 为 蓝 色 或 绿色 的 圆 环 ， 呈 现在 探测 项 目 外 周 。 同 一 试 次 内 ， 前 后 两 个 线索 颜 


ime 


色 不 同 。 最 后 ， 在 所 有 探测 结束 后 对 被 试 进行 反馈 。 反 馈 屏 左 侧 和 右 侧 信息 分 别 
项 目的 反应 结果 (“正确 ”或 “错误 ”)。 被 试 先 练习 10 个 试 次 ， 


此 外 ， 为 了 排除 被 试 根据 线索 顺序 预期 第 二 个 线索 颜色 的 可 能 性 ， 增 加 24 个 填充 试 次 。 
试 次 中 ， 前 后 两 个 线索 颜色 相同 ， 全 为 蓝 色 或 绿色 的 情况 各 12 个 试 次 。 


(2) 联 结 学 习 阶段 

除 以 下 方面 外 ， 实 验 2 联结 学 习 阶段 流程 与 实验 
种 ， 分 别 对 应 高 奖赏 (+50 分 ) 和 低 奖赏 (+5 分 )。 绿 色 按 
色 的 匹配 关系 在 被 试 间 平衡 。 被 试 先 练习 10 个 试 次 ， 
(3) 后 测 阶 段 


后 测 阶段 线索 颜色 与 奖赏 水 平 关 联 ， 两 者 的 对 应 关系 与 联结 学 习 阶 段 一 


位 置 分 为 SP1 和 SP2 两 个 水 平 。 因 此 ， 后 测 为 2 (高 奖赏 
T1、T2) 被 试 内 实验 设计 。 
除 以 下 方面 外 ， 实 验 2 后 测 流程 与 前 测 相 同 ( 见 图 


SE 


提示 对 应 位 


随后 完成 120 个 实验 试 次 。 


填充 


1 相同。 奖赏 刺激 仅 包括 蓝 色 和 绿色 两 
按键 与 颜 


“Oo? fit, HEH MS” BE, 


随后 完成 120 个 实验 试 次 。 


致 。 高 奖赏 线索 


SAAD: SP1、SP2)x2 (探测 项 目 : 


4)。 后 测 反馈 信息 分 两 屏 呈 现 。 


E 


贯 屏 分 另 


次 的 实际 得 分 。 如 果 反 应 正确 ， 则 同时 在 文字 周围 呈现 与 得 分 相同 的 点 数 。 
幕 中 央 提 示 截 止 到 当前 试 次 的 (D) 实 际 总 分 和 (2) 可 获得 总 


绩 的 总 和 。 后 测 包括 10 个 练习 试 次 、240 个 实验 试 次 和 48 个 填充 试 次 。 


相同 ， 全 为 蓝 色 或 绿色 的 情况 各 24 个 试 次 。 


实验 2 共 需 90 分 钟 左右 。 正 式 实验 过 程 中 ， 前 测 阶段 每 48 次 休息 


每 40 次 休息 一 次 ， 后 测 阶段 每 72 次 休息 一 次 。 
(4) 信 心 判断 

实验 结束 后 ， 询 问 被 试 “ 在 第 一 个 线索 出 现 之 后 ， 
索 的 颜色 ? “。 要 求 被 试 对 其 自信 程度 进行 7 点 评分 ， 
全 没有 信心 ”。 


3.2 结果 


实验 2 采用 R 3.6.2 和 JASP 0.16.4 软件 进行 统计 分 析 与 处 理 。 
同 。 排 除 1 名 个 人 平均 成 绩 低 于 总 体 平均 成 绩 三 个 标准 


计 分 析 具 体 如 下 : 


Pra ee 
F 


Hi 
a 


你 有 多 大 的 把 握 可 以 推测 出 


别 在 屏幕 左 、 右 两 侧 提示 对 应 位 置 项 目的 (1) 反 应 结果 (“正确 ”、“ 错 误 ”) 和 (2) 当 前 斌 
第 二 反馈 屏 在 屏 
分 。 这 两 个 分 数 均 为 两 个 记忆 项 目 成 
前 后 两 个 线索 颜色 


一 次 ， 联 结 学 习 阶 段 


个 线 


7 分 对 应 “完全 有 信心 ”1 分 对 应 “ 完 


数据 剔除 标准 与 实验 1 相 
差 的 被 试 ， 共 获得 59 个 有 效 数 据 。 统 


(1) RAS 


才学 习 阶 段 。 以 了 


条 件 之 间 的 任务 表现 差异 ， 以 检验 颜色 与 价值 之 间 是 否 成 功 建立 联结 。 


CO) 工作 记忆 测试 阶段 。 以 被 试 反应 的 角度 1 
对 前 测 的 角度 偏差 进行 2 中 性 线索 1 位 置 : 
分 析 ， 考 察 提 取 顺 序 影 响 记忆 准 确 性 的 基线 水 平 。 其 次 ， 对 后 测 的 角度 人 
Tl1、7T2) 重 复 测量 方差 分 析 ， 考 察 奖 党 如何 调节 不 同 提取 


索 位 置 : SP1、 


SP1、 


SP2)x2 (探测 项 目 : 


局 差 作 为 估计 记忆 准确 性 的 因 变量 指标 。 


SP2)x2( 探 测 项 目 : T1、T2) 重 复 测量 方差 


yee pe 


E 确 率 和 反应 时 为 指标 ， 采 用 单 因 素 方 差分 析 比 较 高 、 低 奖赏 


TU» 


aE Eí 


2 (高 奖赏 线 


顺序 项 目的 记忆 准确 性 。 最 后 ， 以 前 测 成 绩 减 去 后 测 成 绩 得 到 的 差 值 估计 奖赏 促进 量 ( 前 测 中 
性 线索 1、2 分 别 与 后 测 高 、 低 奖赏 线索 条 件 对 应 )。Q@ 对 促进 量 进行 2 (高 奖赏 线索 位 置 : 
SP1、SP2)x2 (探测 项 目 : T1、T2) 重 复 测 量 方差 分 析 ， 以 检验 奖赏 对 不 同 提取 顺序 项 目 促进 


力 : 高 、 低 ) 重 复 测量 方差 分 析 ， 以 检验 奖赏 促进 作 


作 记 忆 能 力 ， 为 被 试 间 变 量 。 分 别 将 前 测 成 绩 如 


组 。 


3.2.1 前 测 阶 段 


对 前 测 的 4 


程度 的 差异 ，@ 对 促进 量 进行 2 (高 奖赏 线索 位 置 ， SP1、SP2)x2 (探测 
本 差异 。 其 


E 前 30% 和 后 30% 的 被 试 作为 高 能 


的 个 


4 度 偏 差 进行 2x2 重复 测量 方差 分 析 。 结 果 发 现 ， 探 测 项 目 
= 66.95, p < 0.001, nè = 0.54, BFio > 1000)。T2 的 角度 人 


说 明 连 续 提 取 过 程 ， 先 提取 项 目 成 绩 更 好 。 


项 目 : 


， 能 力 


性 线索 1 位 置 主 效应 (F< 1, BFio = 142) 和 两 者 


T1, T2) x2 (能 
是 指 个 体 的 工 
和 低能 


主 效应 显著 (7K(1, 58) 


i Ae(M = 15.00) 显 著 大 于 T1 (M= 10.96)。 


交互 作用 (FA, 58) = 2.42, p = 0.125, nè = 0.04, BFio = 0.328) 均 不 显著 (图 SA) 。 该 结果 表明 ， 


后 提取 项 目的 记忆 成 绩 受到 了 先 提取 项 目 


的 干扰 。 


为 进一步 有 


“中 性 线索 1- 中 性 线索 2”“ 中 愧 


外 认 线 索 组 合 方式 对 实验 结果 的 影响 ， 将 前 测 填 充 试 次 数据 纳入 分 析 ， 比 较 
线索 2- 中 性 线索 1 ””“ 中 性 线索 1- 中 性 线索 1”、“ 


性 线 


索 2- 中 性 线索 2” 四 种 条 件 的 平均 记忆 成 绩 。 单 因素 方差 分 析 结 果 显示 线索 组 合 方 式 不 影响 


平均 记忆 成 绩 (F < 1 BFio= 0.031)。 该 结 


果 进 


3.2.2 联结 学 习 阶段 
分 别 以 正确 率 和 反应 时 为 因 变量 ， 进 行 单 因素 两 


正确 率 上 ， 奖 赏 主 效应 不 显著 (F(1, 58) = 2.21, p = 0.142, n? = 0.04, BFio= 0.557)。 反 应 时 上 ， 


DERF 


均 记 忆 成 绩 不 受 线索 颜色 影响 。 


水 


“(奖赏 : 


高 、 低 ) 重 复 测量 方差 分 析 。 


奖赏 主 效应 显著 (F(1, 58) = 27.99, p < 0.001, n? = 0.33, BFio > 1000)。 高 奖赏 条 件 反 应 时 (M = 


385.37) BRA 


联结 。 


3.2.3 后 测 阶 段 


F 低 奖赏 反应 时 (M = 406.09) (图 2B)。 


该 结果 对 


SA aE AR A ZT] T 


对 后 测 的 角度 偏差 进行 2x2 重复 测量 方差 分 析 。 结 果 发 现 ， 探 测 项 目 主 


效应 显著 (F(1, 58) 


= 97.58, p < 0.001, n? = 0.63, BFio > 1000)。T2 的 角度 偏差 (CM = 11.17) 显 著 大 于 T1 (M= 9.78). 


高 奖赏 线索 位 置 主 效应 不 显著 (F(1, 58) = 1.67, p = 0.202, n? = 0.03, BFio = 0.2 


04) 。 高 奖赏 线索 


位 置 和 探测 项 目 之 间 交 互 作用 显著 (F(1, 58) = 9.00, p = 0.004, n? = 0.13, BFio = 84.711)。 简 单 


效应 分 析 结 果 显 示 ， 探 测 Tl 时 ，SP1 RM = 9.57) 成 绩 好 于 SP2 条 件 CM = 9.99) (1(58) = 


2.33, p = 0.023, Cohen’s d = 0.30); 探测 T2 时 ，SP1 RFM = 11.55) 成 绩 差 于 SP2 条 件 (M = 


10.78) (1(58) = 2.69, p = 0.009, Cohen’s d = 0.35) (图 SB)。 该 结果 表明 ， 虽 然 总 体 上 后 提取 项 目 


成 绩 仍 明显 受到 先 提 取 项 目的 和 干扰， 但 相 比 于 低 奖 赏 条 件 ， 高 奖赏 线索 对 先 提 取 和 后 提取 项 


目 成 绩 均 有 促进 。 并 且 ， 高 奖赏 线索 位 置 主 效应 不 显著 表明 奖赏 的 调节 机 制 


为 资源 再 分 配 。 


为 进一步 确认 线索 组 合 方式 对 实验 结果 的 影响 ， 将 后 测 填充 试 次 数据 纳入 分 析 ， 比 较 


“高 奖赏 线索 - 低 奖 党 线索 ”“ 低 奖 党 线索 -高 奖赏 线索 “高 奖赏 线索 -高 奖赏 线索 ”“ 低 


奖赏 线索 - 低 奖赏 线索 ”四 种 条 件 的 平均 记忆 成 绩 。 单 因素 方差 分 析 结 果 显 示 线 索 组 合 方式 


不 影响 平均 记忆 成 绩 (F(3, 174) = 0.57, p = 0.636, nè = 0.01, BFio= 0.041)。 


该 结果 进一步 证 实 平 


*k 


均 记忆 成 绩 不 受 高 、 低 奖赏 线索 组 合 方式 影响 ， 即 支持 资源 再 分 配 理论 。 
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图 5 实验 2(A) 前 测 阶段 和 (B) 后 测 阶段 角度 偏差 结果 


注 :“e” 代 表 均 值 。*p < 0.05, **p < 0.01, ***p < 0.001 


3.2.4 前 、 后 测 比较 


目 


首先 ， 对 促进 量 进 行 2x2 重复 测量 方差 分 析 。 结 果 发 现 探测 项 目 主 效应 显著 (F(1, 58) = 


23.66, p < 0.001, nè = 0.29, BFio> 1000). T2 的 促进 量 (M = 3.83) KF TI 


赏 线索 位 置 主 效应 不 显著 (F(1, 58) = 1.07, p = 0.305, n? = 0.02, BFio = 0.168). 


(M= 1.17)。 高 奖 


两 者 交互 作用 显 


34(F(1, 58) = 8.61, p = 0.005, n = 0.13, BFio= 2.670)。 简 单 效 应 分 析 发 现 ， 探 测 TI1 时 ，SP1 (M 


= 1.52) 和 SP2 (M = 0.83) 条 件 差异 显著 (1(58) = 2.30, p = 0.025, Cohen’s d = 0.30); 探测 T2 FF, 


SP1 (M = 3.21) 和 SP2 (M = 4.44) 条 件 差 异 显著 (!(58) = -2.41, p = 0.019, Cohen’s d = 0.31). 


果 表 明 ， 一 方面 高 奖赏 线索 对 先 提取 和 后 提取 项 目 均 有 明显 促进 ， 另 一 方面 ， 奖 赏 对 后 提取 
项 目的 促进 作用 强 于 先 提 取 项 目 (图 6)。 


促进 量 
高 奖赏 线索 位 置 外 SP1 & SP2 


时 


一 = 
a 局 a 


(前 测 -后 测 (?)) 


促 


T1 T2 
探测 项 目 


图 6 实验 2 奖赏 促进 量 (前 测 一 后 测 ) 结 果 


jE: “e” REHE. *p< 0.05 


最 后 ， 对 促进 量 进行 2 (高 奖赏 线索 位 置 : SP1、SP2)x2 (探测 项 目 : T1, T2) x2 (能 
高 、 低 ) 重 复 测 量 方差 分 析 。 结 果 发 现 高 奖赏 线索 位 置 主 效应 不 显著 (F(1, 34) = 1.53, p = 0.225, 


ng = 0.04, BFio= 0.215)。 探 测 项 目 主 效应 显著 (F(1, 34) = 20.96, p < 0.001, n? = 0.38, BFio > 


1000)。 能 力主 效应 显著 (FU, 34) = 29.71, p < 0.001, nê = 0.47, BFio> 1000)。 低 能 力 组 促进 量 


(M=5.19) 显 著 大 于 高 能 力 组 (M = 0.36)。 二 阶 交互 作用 方面 ， 高 奖赏 线索 位 置 和 探测 项 目的 


交互 作用 、 探 测 位 置 和 能 力 的 交互 作用 均 显著 (F(1, 34) = 7.55 & 11.53, p = 0.010 & 0.002, nè = 


z, 


0.18 & 0.25, BFio= 1.429 & BFio> 1000)。 高 奖赏 线索 位 置 和 能 力 的 交互 作用 不 显著 (F(1, 34) = 


2.07, p = 0.159,m; = 0.06, BFio= 0.309)。 三 阶 交 互 作用 显著 (F(1, 38) = 5.05, p = 0.031, nè = 0.13, 


BFio= 1.038)。 简 单 效 应 分 析 显 示 ， 高 能 力 组 中 ， 探 测 项 目 主 效应 显著 (F(1, 17) = 5.60, p = 


0.030, n; = 0.25, BFio= 3.978); 高 奖赏 线索 位 置 主 效应 和 两 者 交互 作用 均 不 显著 (Fs < 1, BF io 


= 0.240 & 0.412)。 低 能 力 组 中 ， 探 测 项 目 主 效应 显著 (F(1, 17) = 16.95, p < 0.001, n = 0.50, 


BFio> 1000); 高 奖赏 线索 位 置 主 效应 不 显著 (F(1, 17) = 2.28, p = 0.149, n? = 0.12, BFio= 0.306); 


两 者 交互 作用 显著 (FU 17) = 7.46, p = 0.014, nè = 0.31, BFio= 2.147)。 简 单 效应 分 析 发 现 ， 探 
M) T1 EF, SP1 (WM= 2.95) 和 SP2 (M = 1.76) 条 件 差异 不 显著 ({(17) = 1.57, p = 0.146, Cohen’s d = 


0.36); 探测 T2 时 ，SP1 (M = 6.59) 和 SP2 (M = 9.42) 条 件 差异 显著 (1(17) = -2.62, p = 0.018, 


Cohen’s d = 0.62) (图 7)。 该 结果 表明 ， 高 能 力 组 中 奖赏 促进 量 主要 受到 探测 顺序 调节 ， 与 高 


奖赏 线索 位 置 无 关 。 低 能力 组 中 奖赏 的 促进 作用 主要 体现 在 第 二 次 提取 过 程 中 。 


er ot 
高 能 力 组 低能 力 组 
高 奖赏 线索 位 置 白 SP1 & SP2 高 奖赏 线索 位 置 A SP1 EA SP2 
25 
二 20 = 
E 15 È 
= 10 * z 
2 E 
咽 5 me} 
: es 5 
So h n 
-5 
T1 T2 Peen 
7 实验 2 奖赏 促进 量 ( 前 测 一 后 测 ) 个 体 差 异 
注 :“。e” 代 表 均 值 。*p < 0.05 
3.2.5 信心 判断 
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(1(59) =-2.71, p= 0.009)， 即 被 试 不 能 提前 推测 出 第 二 个 线索 的 颜色 。 


4 讨论 

本 文通 过 2 个 实验 探究 提取 阶段 出 现 的 奖赏 信号 对 工作 记忆 提取 过 程 的 影响 及 其 机 制 。 
首先 ， 实 验 1 和 2 均 发 现 奖赏 可 以 直接 影响 工作 记忆 的 提取 准确 性 。 实 验 1 中 虽然 高 、 低 奖 
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能 力 越 低 的 个 体 越 倾向 于 使 用 认 知 策略 促进 任务 表现 。 高 能 力 组 中 ， 奖 赏 对 T2 项 目的 促进 
大 于 T1， 且 该 促进 作用 不 受 高 奖赏 线索 位 置 影响 。 这 表明 高 能 力 组 被 试 有 足够 的 认 知 资源 对 
所 有 记忆 项 目 进行 高 精度 的 表征 ， 无 须根 据 价值 水 平 调整 认 知 策略 就 可 以 改善 后 提取 项 目的 
FY. Griffin 等 人 (2019) 研 究 也 发 现 ， 高 工作 记忆 能 力 的 个 体 虽 然 对 高 价值 词 对 具有 选择 性 
偏好 ， 但 这 种 影响 非常 微弱 。 低 能 力 组 中 ， 奖 赏 的 促进 作用 受到 探测 顺序 和 高 奖赏 线索 位 置 
的 交互 影响 。 高 奖赏 线索 对 T1 的 促进 作用 与 低 奖赏 线索 无 差异 ， 而 对 T2 的 促进 作用 显著 强 
于 低 奖赏 线索 。 但 总 体 上 ， 高 奖赏 线索 位 置 对 平均 记忆 成 绩 无 影响 。 这 表明 ， 低 能 力 组 被 试 
比 高 能 力 组 被 试 更 易于 受到 项 目 奖赏 水 平 变化 的 影响 ， 并 且 其 奖赏 调节 作用 遵循 资源 再 分 配 
的 机 制 。 以 往 关于 工作 记忆 能 力 和 策略 使 用 的 相关 研究 也 指出 ， 个 体 为 使 收益 最 大 化 会 在 纺 
码 过 程 中 使 用 更 有 效 的 策略 ， 尤 其 是 低 工 作 记忆 能 力 的 个 体 (Turley-Ames & Whitfield, 2003). 
但 也 有 研究 指出 ， 低 工作 记忆 能 力 的 个 体 自发 地 使 用 有 效 编码 策略 的 频率 低 于 高 工作 记忆 能 
力 个 体 (Robison & Unsworth, 2017)。 本 研究 中 ， 实 验 2 任务 仅 要 求 记忆 两 个 项 目 ， 任 务 负荷 
较 低 ， 可 能 不 利于 奖赏 的 调节 作用 在 高 能 力 组 中 显现 出 来 。 后 续 研 究 可 以 进一步 考察 工作 记 
忆 负 荷 与 个 体能 力 差异 对 奖赏 调节 作用 的 交互 影响 。 

结论 

通过 对 认 知 资源 进行 再 分 配 ， 奖 赏 可 以 在 不 影响 编码 和 保持 的 条 件 下 直接 促进 工作 记忆 
提取 准确 性 。 连 续 提取 过 程 中 ， 该 促进 作用 对 后 提取 项 目的 影响 强 于 先 提 取 项 目 。 并 且 ， 工 
作 记 忆 能 力 低 的 个 体 更 容易 受到 奖赏 的 调节 。 
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Reward Facilitates Working Memory Precision during Retrieval 
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Abstract 


Reward can improve working memory performance. However, there has been controversy on 
whether reward can regulate the retrieval of working memory. Some studies have presented 
reward signals before the retrieval stage, with the results showing that reward can affect the 
retrieval phase during working memory. Klink et al. (2017) indicated that reward cues presented in 
the retrieval phase cannot affect working memory. However, this finding lacks support in the 
literature and needs to be further tested. The present study aims to explore the mechanism and 
effect of reward on the precision of working memory during retrieval. 

A total of 24 participants (experiment 1) and 60 participants (experiment 2) were recruited for 
two experiments. Experiment 1 included two stages: association learning and memory test. The 
participants first established the connection between color and value through association learning. 
Thereafter, a working memory test was conducted. Reward cues were presented with the memory 
probe during the working memory test. Experiment 2 included four stages: pretest, association 
learning, posttest, and confidence assessment. Pre- and post-test tasks were the same, in which the 
participants performed two memory tests in sequence during the retrieval phase. Colored cues 
were not related to rewards in the pre-test but associated with rewards in the post-test. Confidence 
judgment required the participants to evaluate their confidence that they can infer the color of the 
second cue based on the color of the first cue. This undertaking aimed to test whether the 
participants have expectations for the order of cues. 

Results of experiment 1 showed that the effect of reward was significant in the memory test 
stage. In particular, memory performance with high and low reward cues was better than that with 
no reward cues. Results of the post-test of experiment 2 showed a significant main effect of test 
order. Memory performance of the first test item was particularly better than that of the second test 


item. Moreover, there was a significant test order by serial position of the high-reward cue 


interaction effect. Memory performance of the first test item was better when the high-reward cue 
appeared before the low-reward cue. Memory performance of the second test item was better 
when the low reward cue appeared before the high-reward cue. The participants’ working memory 
capacity was differentiated according to their performance during the pre-test to investigate the 
individual differences of the reward effects. Results likewise indicated that reward did not affect 
the memory performance of the high-capacity group. For the low-capacity group, memory 
performance was affected by the test order, serial position of the high-reward cue, and their 
interaction. Thus, the effect of reward was more evident with the low-capacity group. 

The present study was the first to observe that rewards can directly regulate working memory 
retrieval without affecting encoding and retention. In addition, the regulation mechanism of 
reward on working memory retrieval involved the redistribution of working memory resources. 
Such a reward regulation was affected by the test order and working memory capacity. Moreover, 
findings indicated that individuals can adjust cognitive strategies before or during learning 
according to the item value to promote working memory processing. They can also adjust retrieval 
precision after learning according to the value of information set by the test. This flexible working 
memory regulation mechanism plays an important role in promoting human cognitive activities 
and social adaptation. 


Keywords working memory, reward, retrieval precision 


